检索结果

Select

1. 融合先验知识和字形特征的中文命名实体识别

董永峰, 白佳明, 王利琴, 王旭

《计算机应用》唯一官方网站 2024, 44 (3): 702-708. DOI: 10.11772/j.issn.1001-9081.2023030361

摘要（191）

HTML （8）

PDF （750KB）（172）

针对命名实体识别（NER）任务中相关模型通常仅对字符及相关词汇进行建模，未充分利用汉字特有的字形结构信息和实体类型信息的问题，提出一种融合先验知识和字形特征的命名实体识别模型。首先，采用结合高斯注意力机制的Transformer对输入序列进行编码，并从中文维基百科中获取实体类型的中文释义，采用双向门控循环单元（BiGRU）编码实体类型信息作为先验知识，利用注意力机制将它与字符表示进行组合；其次，采用双向长短时记忆（BiLSTM）网络编码输入序列的远距离依赖关系，通过字形编码表获得繁体的仓颉码和简体的现代五笔码，采用卷积神经网络（CNN）提取字形特征表示，并根据不同权重组合繁体与简体字形特征，利用门控机制将它与经过BiLSTM编码后的字符表示进行组合；最后，使用条件随机场（CRF）解码，得到命名实体标注序列。在偏口语化的数据集Weibo、小型数据集Boson和大型数据集PeopleDaily上的实验结果表明，与基线模型MECT（Multi-metadata Embedding based Cross-Transformer）相比，所提模型的F1值别提高了2.47、1.20和0.98个百分点，验证了模型的有效性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

2. 在线学习资源推荐综述

董永峰, 王雅琮, 董瑶, 邓亚晗

《计算机应用》唯一官方网站 2023, 43 (6): 1655-1663. DOI: 10.11772/j.issn.1001-9081.2022091335

摘要（628）

HTML （59）

PDF （824KB）（503）

近年来越来越多的学校广泛使用网络在线授课，然而互联网中海量的学习资源令学习者难以抉择。因此，研究在线学习资源推荐并为学习者进行个性化推荐非常重要，这可以帮助学习者快速获取其所需的优质学习资源。针对在线学习资源推荐的研究现状，从以下5个方面进行分析总结。首先，总结了目前国内外在线教育平台在学习资源推荐方面的工作；其次，分析和探讨了以知识点习题、学习路径、学习视频和学习课程为学习资源推荐目标的4种算法；接着，分别从学习者和学习资源的角度出发，以具体的算法为例，详述了常用的基于学习者画像、基于学习者行为和基于学习资源本体的3种学习资源推荐算法；此外，总结了公开的在线学习资源数据集；最后，分析了学习资源推荐系统目前存在的问题和未来的发展方向。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

3. 基于改进一维卷积和双向长短期记忆神经网络的故障诊断方法

董永峰, 孙跃华, 高立超, 韩鹏, 季海鹏

《计算机应用》唯一官方网站 2022, 42 (4): 1207-1215. DOI: 10.11772/j.issn.1001-9081.2021071243

摘要（531）

HTML （22）

PDF （2185KB）（329）

针对工业领域中故障诊断数据存在时序性和夹杂强噪声的特点导致的收敛速度慢以及诊断精度低的问题，提出了一种基于改进一维卷积和双向长短期记忆（1DCNN-BiLSTM）神经网络融合的故障诊断方法。该方法包括故障振动信号的预处理、特征的自动提取以及振动信号的分类。首先，采用自适应白噪声的完整经验模态分解（CEEMDAN）技术对原始振动信号进行预处理；其次，构建1DCNN-BiLSTM双通道模型，将处理后信号输入双向长短期记忆（BiLSTM）神经网络模型和一维卷积神经网络（1DCNN）模型两个通道，从而对信号的时序相关性特征、局部空间的非相关性特征和弱周期性规律进行充分提取；然后，针对信号夹杂强噪声的问题，对压缩与激励网络（SENet）模块进行改进并将其作用于两个不同的通道；最后，输入全连接层将双通道提取的特征进行融合并借助Softmax分类器实现对设备故障的精确识别。使用凯斯西储大学轴承数据集进行实验，结果表明改进后的SENet模块同时作用于1DCNN通道和stacked BiLSTM通道，1DCNN-BiLSTM双通道模型在保证快速收敛的情况下有最高诊断精度96.87%，优于传统单通道模型，有效提高了机械设备故障诊断效率。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

4. 基于深度学习的聚类综述

董永峰, 邓亚晗, 董瑶, 王雅琮

《计算机应用》唯一官方网站 2022, 42 (4): 1021-1028. DOI: 10.11772/j.issn.1001-9081.2021071275

摘要（830）

HTML （58）

PDF （623KB）（512）

聚类是一种寻找数据之间内在结构的技术，是许多数据驱动应用领域的一个基本问题，而聚类性能在很大程度上取决于数据表示的质量。近年来，深度学习因其强大的特征提取能力被广泛地应用于聚类任务，以学习更好的特征表示，显著提高了聚类性能。首先，介绍了传统的聚类任务；然后，根据网络结构介绍了基于深度学习的聚类及代表性方法，指出了当前存在的问题，并介绍了基于深度学习的聚类在不同领域的应用；最后，对基于深度学习的聚类发展进行了总结与展望。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

5. 基于作者偏好的学术投稿刊物推荐算法

董永峰, 屈向前, 李林昊, 董瑶

《计算机应用》唯一官方网站 2022, 42 (1): 50-56. DOI: 10.11772/j.issn.1001-9081.2021010185

摘要（445）

HTML （35）

PDF （605KB）（266）

针对投稿刊物推荐算法总是单独考虑文本主题或者作者历史发刊记录，导致投稿刊物推荐结果准确率低的问题，提出了一种基于作者偏好的学术刊物投稿推荐算法。该算法不仅协调使用了文本主题和作者历史发刊记录，还挖掘了投稿刊物的学术焦点与时间的潜在联系。首先，使用潜在狄利克雷（LDA）主题模型对文章标题进行主题提取；其次，建立主题-刊物和时间-刊物的模型图，并采用大规模信息网络嵌入（LINE）模型学习异构图节点的嵌入；最后，融合作者的主题偏好和历史发刊记录来计算刊物的综合得分，并据此对投稿作者进行投稿刊物推荐。在两个公开数据集DBLP和PubMed上的实验结果表明，相比奇异值分解（SVD）、DeepWalk、非负矩阵分解（NMF）等6个算法，所提出的算法在不同推荐的投稿刊物列表长度的情况下的召回率均为最优，并且在需要从论文和知识库中获取更少信息的同时，保持了较高的准确性，能有效提高投稿刊物推荐算法的鲁棒性。

图表 | 参考文献 | 相关文章 | 多维度评价

Select

6. 融合多跳关系路径信息的关系推理方法

董永峰, 刘超, 王利琴, 李英双

计算机应用 2021, 41 (10): 2799-2805. DOI: 10.11772/j.issn.1001-9081.2020121905

摘要（326）

PDF （763KB）（330）

针对目前知识图谱（KG）中存在大量关系的缺失，以及在进行关系推理时没有充分考虑两实体间多跳路径中隐含信息的问题，提出了一种融合多跳关系路径信息的关系推理方法。首先，对于给定的候选关系和两个实体，利用卷积运算将连接两个实体的多跳关系路径编码到低维空间里并提取信息；其次，利用双向长短时记忆（BiLSTM）网络建模以生成关系路径表示向量，并利用注意力机制将其与候选关系表示向量进行组合；最后，采用多步推理方式找到匹配程度最高的关系作为推理结果并判断其精确率。与目前常用的路径排序算法（PRA）、神经网络模型Path-RNN以及强化学习模型MINERVA相比，在使用大型知识图谱数据集NELL995进行实验时，所提算法的平均精确率均值（MAP）分别提高了1.96、8.6和1.6个百分点；在使用小型知识图谱数据集Kinship进行实验时，所提方法的MAP比PRA、MINERVA分别提高了21.3、13和12.1个百分点。实验结果表明，所提算法能更加准确地推理出实体间的关系链接。

参考文献 | 相关文章 | 多维度评价

Select

7. 基于迁移学习与多标签平滑策略的图像自动标注

汪鹏, 张奥帆, 王利琴, 董永峰

计算机应用 2018, 38 (11): 3199-3203. DOI: 10.11772/j.issn.1001-9081.2018041349

摘要（764）

PDF （960KB）（594）

针对图像标注数据集标签分布不平衡问题，提出了基于标签平滑策略的多标签平滑单元（MLSU）。MLSU在网络模型训练过程中自动平滑数据集中的高频标签，使网络适当提升了低频标签的输出值，从而提升了低频标注词的标注性能。为解决图像标注数据集样本数量不足造成网络过拟合的问题，提出了基于迁移学习的卷积神经网络（CNN）模型。首先利用互联网上的大型公共图像数据集对深度网络进行预训练，然后利用目标数据集对网络参数进行微调，构建了一个多标签平滑卷积神经网络模型（CNN-MLSU）。分别在Corel5K和IAPR TC-12图像标注数据集上进行实验，在Corel5K数据集上，CNN-MLSU较卷积神经网络回归方法（CNN-R）的平均准确率与平均召回率分别提升了5个百分点和8个百分点；在IAPR TC-12数据集上，CNN-MLSU较两场 K最邻近模型（2P KNN_ML）的平均召回率提升了6个百分点。实验结果表明，基于迁移学习的CNN-MLSU方法能有效地预防网络过拟合，同时提升了低频词的标注效果。

参考文献 | 相关文章 | 多维度评价

Select

8. 基于头脑风暴优化算法的多机器人气味源定位

梁志刚, 顾军华, 董永峰

计算机应用 2017, 37 (12): 3614-3619. DOI: 10.11772/j.issn.1001-9081.2017.12.3614

摘要（498）

PDF （1048KB）（658）

针对现有室内湍流环境下多机器人气味源搜索算法存在历史浓度信息利用率不高、缺少调节全局与局部搜索的机制等问题，提出头脑风暴优化（BSO）算法与逆风搜索结合的多机器人协同搜索算法。首先，将机器人已搜索位置初始化为个体，以机器人位置为中心聚类，有效利用了历史信息的指引作用；然后，将逆风搜索作为个体变异操作，动态调节选中一个类中个体或两个类中个体融合生成新个体的数量，有效调节了全局和局部搜索方式；最后，根据浓度和持久性两个指标对气味源进行确认。在有障碍和无障碍两个环境中将所提算法与三种群体智能多机器人气味源定位算法进行定位对比仿真实验，实验结果表明，所提算法的平均搜索时间减少33%以上，且定位准确率达到100%。该算法能够有效调节机器人全局和局部搜索关系，快速准确定位气味源。

参考文献 | 相关文章 | 多维度评价

Select

9. 移动机器人动态路径规划方法的研究与实现

史进, 董瑶, 白振东, 崔泽晨, 董永峰

计算机应用 2017, 37 (11): 3119-3123. DOI: 10.11772/j.issn.1001-9081.2017.11.3119

摘要（907）

PDF （721KB）（569）

针对在未知动态障碍物存在且目标点移动的环境下，采用人工势场法规划路径时斥力影响半径往往大于障碍物的半径从而导致动态障碍物与机器人发生碰撞的问题，提出非完全等待策略与Morphine算法相结合的改进人工势场法动态路径规划策略。当动态障碍物与机器人发生侧面碰撞时采用非完全等待策略；当动态障碍物与机器人发生迎面碰撞时采用Morphine算法局部规划路径；同时引入滚动窗口理论提高躲避动态障碍物的精确度。通过仿真实验，与传统人工势场作对比，提出的改进算法在发生侧面碰撞时要缩短12步，在发生迎面碰撞时要缩短6步，由此可得提出改进算法在路径平滑性和规划步数方面效果更优。

参考文献 | 相关文章 | 多维度评价

Select

10. 新的室内移动机器人自定位方法

周艳聪, 董永峰, 王安娜, 顾军华

计算机应用 2015, 35 (2): 585-589. DOI: 10.11772/j.issn.1001-9081.2015.02.0585

摘要（567）

PDF （837KB）（448）

针对现有室内移动机器人自定位方法中存在的定位精度不高,随时间积累定位误差增大,复杂室内环境下信号存在多径效应和非视距效应等问题,提出了一种基于蒙特卡罗定位(MCL)的新的移动机器人自定位方法。首先,通过分析基于无线射频识别(RFID)技术的移动机器人自定位系统,建立机器人运动模型;然后,通过分析基于接收信号强度指示(RSSI)的移动机器人自定位系统,提出机器人移动过程的观测模型;最后,针对粒子滤波定位执行效率不高的问题,提出粒子剔除策略和依据粒子方位赋予粒子权值策略,提高系统的定位精度和执行效率。仿真实验表明,机器人在移动过程中的自定位误差在X轴和Y轴方向上为3 cm,传统定位算法误差为6cm,新算法定位精度提高近1倍,且算法具有很好的鲁棒性。

参考文献 | 相关文章 | 多维度评价

Select

11. 不完整多视图聚类综述

董瑶付怡雪董永峰史进陈晨

《计算机应用》唯一官方网站 DOI: 10.11772/j.issn.1001-9081.2023060813
预出版日期: 2023-08-21